接下來的四篇文章,將分別介紹課程中提及的四個Google Cloud Platform上提供的機器學習預訓練模型API,透過這些預訓練模型加上以呼叫API的方式進行使用,我們能夠快速方便地享受到經由Google結合自身大量資料與堅實機器學習實力所訓練出來的模型,在我們欲達成的任務上取得優良的成果。
首先第一篇文章要介紹的是Vision API(註1),電腦視覺領域可說是在機器學習的應用上發展地最快速的領域之一,比如**光學文字辨識(Optical Character Recognition, OCR)與物體偵測(Object Detection)**等應用,都為我們的生活帶來許多進步與方便之處。
透過Google Cloud Platform的Vision API,我們可以完成以下工作(非涵蓋全部Vision API功能,在此以列舉課程中提到的功能為主):
在實際的商業應用上,知名的GIF搜尋引擎公司Giphy(註2),就有使用Vision API當中的OCR功能,來增進其搜尋體驗。(註3)
註1: https://cloud.google.com/vision/
註2: https://giphy.com/
註3: https://engineering.giphy.com/enhancing-giphy-search-with-google-cloud-ml-tools/